Model Selection

Spatio-Temporal Feature Extraction

# Spatio-Temporal Feature Extraction

Vivit B 16x2 Kinetics400 UCF Crime Finetuned AbnormalVideosOnly

This model is a video classification model based on the ViViT architecture, specifically fine-tuned for anomaly video detection tasks

Video Processing

Videomae Base Finetuned Ssv2

VideoMAE is a video self-supervised pretraining model based on Masked Autoencoder (MAE), fine-tuned on the Something-Something-v2 dataset for video classification tasks.

Video Processing

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase